当前位置: 开发笔记 > 编程语言 > 正文

产品信息|时会_PaddleOCR之安装测试

作者： | 来源：互联网 | 2023-08-31 10:06

篇首语：本文由编程笔记#小编为大家整理，主要介绍了PaddleOCR之安装测试相关的知识，希望对你有一定的参考价值。0背景paddleocr

篇首语：本文由编程笔记#小编为大家整理，主要介绍了PaddleOCR之安装测试相关的知识，希望对你有一定的参考价值。

0 背景

paddleocr 号称最强&＃xff0c;怀着好奇心&＃xff0c;对该软件进行一个安装测试

1 安装

创建一个虚拟环境

conda create -n paddle_env python&＃61;3.8

进入环境&＃xff0c;安装 gpu 版本的 paddlepaddle

conda activate paddle_env python3 -m pip install paddlepaddle-gpu -i https://mirror.baidu.com/pypi/simple

再安装 paddleocr

pip install "paddleocr>&＃61;2.0.1"

注意&＃xff1a;使用 whl 包安装的库支持的算法有限&＃xff0c;比如文本检测部分只支持 DB 算法&＃xff0c;如果要使用其它模型&＃xff0c;需要通过源码安装调试&＃xff0c;具体方法在后续文章中会介绍

下载一张测试图片进行测试&＃xff0c;输出如下

$ paddleocr --image_dir ./word_1.jpg --use_angle_cls true [2021/12/08 15:15:57] root WARNING: version PP-OCRv2 not support cls models, auto switch to version PP-OCR Namespace(benchmark&＃61;False, cls_batch_num&＃61;6, cls_image_shape&＃61;&＃39;3, 48, 192&＃39;, cls_model_dir&＃61;&＃39;/home/lthpc/.paddleocr/2.3.0.2/ocr/cls/ch_ppocr_mobile_v2.0_cls_infer&＃39;, cls_thresh&＃61;0.9, cpu_threads&＃61;10, det&＃61;True, det_algorithm&＃61;&＃39;DB&＃39;, det_db_box_thresh&＃61;0.6, det_db_score_mode&＃61;&＃39;fast&＃39;, det_db_thresh&＃61;0.3, det_db_unclip_ratio&＃61;1.5, det_east_cover_thresh&＃61;0.1, det_east_nms_thresh&＃61;0.2, det_east_score_thresh&＃61;0.8, det_limit_side_len&＃61;960, det_limit_type&＃61;&＃39;max&＃39;, det_model_dir&＃61;&＃39;/home/lthpc/.paddleocr/2.3.0.2/ocr/det/ch/ch_PP-OCRv2_det_infer&＃39;, det_pse_box_thresh&＃61;0.85, det_pse_box_type&＃61;&＃39;box&＃39;, det_pse_min_area&＃61;16, det_pse_scale&＃61;1, det_pse_thresh&＃61;0, det_sast_nms_thresh&＃61;0.2, det_sast_polygon&＃61;False, det_sast_score_thresh&＃61;0.5, drop_score&＃61;0.5, e2e_algorithm&＃61;&＃39;PGNet&＃39;, e2e_char_dict_path&＃61;&＃39;./ppocr/utils/ic15_dict.txt&＃39;, e2e_limit_side_len&＃61;768, e2e_limit_type&＃61;&＃39;max&＃39;, e2e_model_dir&＃61;None, e2e_pgnet_mode&＃61;&＃39;fast&＃39;, e2e_pgnet_polygon&＃61;True, e2e_pgnet_score_thresh&＃61;0.5, e2e_pgnet_valid_set&＃61;&＃39;totaltext&＃39;, enable_mkldnn&＃61;False, gpu_mem&＃61;500, help&＃61;&＃39;&＃61;&＃61;SUPPRESS&＃61;&＃61;&＃39;, image_dir&＃61;&＃39;./word_1.jpg&＃39;, ir_optim&＃61;True, label_list&＃61;[&＃39;0&＃39;, &＃39;180&＃39;], lang&＃61;&＃39;ch&＃39;, layout_path_model&＃61;&＃39;lp://PubLayNet/ppyolov2_r50vd_dcn_365e_publaynet/config&＃39;, max_batch_size&＃61;10, max_text_length&＃61;25, min_subgraph_size&＃61;15, ocr_version&＃61;&＃39;PP-OCRv2&＃39;, output&＃61;&＃39;./output/table&＃39;, precision&＃61;&＃39;fp32&＃39;, process_id&＃61;0, rec&＃61;True, rec_algorithm&＃61;&＃39;CRNN&＃39;, rec_batch_num&＃61;6, rec_char_dict_path&＃61;&＃39;/home/lthpc/anaconda3/envs/paddle_env/lib/python3.8/site-packages/paddleocr/ppocr/utils/ppocr_keys_v1.txt&＃39;, rec_image_shape&＃61;&＃39;3, 32, 320&＃39;, rec_model_dir&＃61;&＃39;/home/lthpc/.paddleocr/2.3.0.2/ocr/rec/ch/ch_PP-OCRv2_rec_infer&＃39;, save_log_path&＃61;&＃39;./log_output/&＃39;, show_log&＃61;True, structure_version&＃61;&＃39;STRUCTURE&＃39;, table_char_dict_path&＃61;None, table_char_type&＃61;&＃39;en&＃39;, table_max_len&＃61;488, table_model_dir&＃61;None, total_process_num&＃61;1, type&＃61;&＃39;ocr&＃39;, use_angle_cls&＃61;True, use_dilation&＃61;False, use_gpu&＃61;True, use_mp&＃61;False, use_onnx&＃61;False, use_pdserving&＃61;False, use_space_char&＃61;True, use_tensorrt&＃61;False, vis_font_path&＃61;&＃39;./doc/fonts/simfang.ttf&＃39;, warmup&＃61;True) [2021/12/08 15:16:00] root INFO: **********./word_1.jpg********** [2021/12/08 15:16:02] root DEBUG: dt_boxes num : 1, elapse : 2.128263235092163 [2021/12/08 15:16:02] root DEBUG: cls num : 1, elapse : 0.007218360900878906 [2021/12/08 15:16:02] root DEBUG: rec_res num : 1, elapse : 0.01619863510131836 [2021/12/08 15:16:02] root INFO: [[[10.0, 8.0], [344.0, 11.0], [343.0, 66.0], [10.0, 63.0]], (&＃39;韩国小&＃39;, 0.9964866)]

环境安装完成

2 python 包测试

2.1 检测 &＃43; 方向分类器 &＃43; 识别全流程

from paddleocr import PaddleOCR, draw_ocr # Paddleocr目前支持中英文、英文、法语、德语、韩语、日语&＃xff0c;可以通过修改lang参数进行切换 # 参数依次为&＃96;ch&＃96;, &＃96;en&＃96;, &＃96;french&＃96;, &＃96;german&＃96;, &＃96;korean&＃96;, &＃96;japan&＃96;。 ocr &＃61; PaddleOCR(use_angle_cls&＃61;True, lang&＃61;"ch") # need to run only once to download and load model into memory img_path &＃61; &＃39;PaddleOCR/doc/imgs/11.jpg&＃39; result &＃61; ocr.ocr(img_path, cls&＃61;True) for line in result: print(line) # 显示结果 from PIL import Image image &＃61; Image.open(img_path).convert(&＃39;RGB&＃39;) boxes &＃61; [line[0] for line in result] txts &＃61; [line[1][0] for line in result] scores &＃61; [line[1][1] for line in result] im_show &＃61; draw_ocr(image, boxes, txts, scores, font_path&＃61;&＃39;/path/to/PaddleOCR/doc/fonts/simfang.ttf&＃39;) im_show &＃61; Image.fromarray(im_show) im_show.save(&＃39;result.jpg&＃39;)

结果是一个list&＃xff0c;每个item包含了文本框&＃xff0c;文字和识别置信度

[[[24.0, 36.0], [304.0, 34.0], [304.0, 72.0], [24.0, 74.0]], [&＃39;纯臻营养护发素&＃39;, 0.964739]] [[[24.0, 80.0], [172.0, 80.0], [172.0, 104.0], [24.0, 104.0]], [&＃39;产品信息/参数&＃39;, 0.98069626]] [[[24.0, 109.0], [333.0, 109.0], [333.0, 136.0], [24.0, 136.0]], [&＃39;&＃xff08;45元/每公斤&＃xff0c;100公斤起订&＃xff09;&＃39;, 0.9676722]] ......

结果可视化

2.2 检测 &＃43; 识别

from paddleocr import PaddleOCR, draw_ocr ocr &＃61; PaddleOCR() # need to run only once to download and load model into memory img_path &＃61; &＃39;PaddleOCR/doc/imgs/11.jpg&＃39; result &＃61; ocr.ocr(img_path, cls&＃61;False) for line in result: print(line) # 显示结果 from PIL import Image image &＃61; Image.open(img_path).convert(&＃39;RGB&＃39;) boxes &＃61; [line[0] for line in result] txts &＃61; [line[1][0] for line in result] scores &＃61; [line[1][1] for line in result] im_show &＃61; draw_ocr(image, boxes, txts, scores, font_path&＃61;&＃39;/path/to/PaddleOCR/doc/fonts/simfang.ttf&＃39;) im_show &＃61; Image.fromarray(im_show) im_show.save(&＃39;result.jpg&＃39;)

结果是一个list&＃xff0c;每个item包含了文本框&＃xff0c;文字和识别置信度

结果可视化

2.3 方向分类器 &＃43; 识别

from paddleocr import PaddleOCR ocr &＃61; PaddleOCR(use_angle_cls&＃61;True) # need to run only once to download and load model into memory img_path &＃61; &＃39;PaddleOCR/doc/imgs_words/ch/word_1.jpg&＃39; result &＃61; ocr.ocr(img_path, det&＃61;False, cls&＃61;True) for line in result: print(line)

结果是一个list&＃xff0c;每个item只包含识别结果和识别置信度

[&＃39;韩国小馆&＃39;, 0.9907421]

2.4 单独执行检测

from paddleocr import PaddleOCR, draw_ocr ocr &＃61; PaddleOCR() # need to run only once to download and load model into memory img_path &＃61; &＃39;PaddleOCR/doc/imgs/11.jpg&＃39; result &＃61; ocr.ocr(img_path, rec&＃61;False) for line in result: print(line) # 显示结果 from PIL import Image image &＃61; Image.open(img_path).convert(&＃39;RGB&＃39;) im_show &＃61; draw_ocr(image, result, txts&＃61;None, scores&＃61;None, font_path&＃61;&＃39;/path/to/PaddleOCR/doc/fonts/simfang.ttf&＃39;) im_show &＃61; Image.fromarray(im_show) im_show.save(&＃39;result.jpg&＃39;)

结果是一个list&＃xff0c;每个item只包含文本框

[[26.0, 457.0], [137.0, 457.0], [137.0, 477.0], [26.0, 477.0]] [[25.0, 425.0], [372.0, 425.0], [372.0, 448.0], [25.0, 448.0]] [[128.0, 397.0], [273.0, 397.0], [273.0, 414.0], [128.0, 414.0]] ......

结果可视化

2.5 单独执行识别

from paddleocr import PaddleOCR ocr &＃61; PaddleOCR() # need to run only once to download and load model into memory img_path &＃61; &＃39;PaddleOCR/doc/imgs_words/ch/word_1.jpg&＃39; result &＃61; ocr.ocr(img_path, det&＃61;False) for line in result: print(line)

结果是一个list&＃xff0c;每个item只包含识别结果和识别置信度

[&＃39;韩国小馆&＃39;, 0.9907421]

2.6 单独执行方向分类器

结果是一个list&＃xff0c;每个item只包含分类结果和分类置信度

[&＃39;0&＃39;, 0.9999924]
3 替换模型

当内置模型无法满足需求时&＃xff0c;需要使用到自己训练的模型。首先&＃xff0c;参照 inference.md 第一节转换将检测、分类和识别模型转换为inference模型&＃xff0c;然后按照如下方式使用

from paddleocr import PaddleOCR, draw_ocr # 模型路径下必须含有model和params文件 ocr &＃61; PaddleOCR(det_model_dir&＃61;&＃39;your_det_model_dir&＃39;, rec_model_dir&＃61;&＃39;your_rec_model_dir&＃39;, rec_char_dict_path&＃61;&＃39;your_rec_char_dict_path&＃39;, cls_model_dir&＃61;&＃39;your_cls_model_dir&＃39;, use_angle_cls&＃61;True) img_path &＃61; &＃39;PaddleOCR/doc/imgs/11.jpg&＃39; result &＃61; ocr.ocr(img_path, cls&＃61;True) for line in result: print(line) # 显示结果 from PIL import Image image &＃61; Image.open(img_path).convert(&＃39;RGB&＃39;) boxes &＃61; [line[0] for line in result] txts &＃61; [line[1][0] for line in result] scores &＃61; [line[1][1] for line in result] im_show &＃61; draw_ocr(image, boxes, txts, scores, font_path&＃61;&＃39;/path/to/PaddleOCR/doc/fonts/simfang.ttf&＃39;) im_show &＃61; Image.fromarray(im_show) im_show.save(&＃39;result.jpg&＃39;)
4 参数说明

字段	说明	默认值
use_gpu	是否使用GPU	TRUE
gpu_mem	初始化占用的GPU内存大小	8000M
image_dir	通过命令行调用时执行预测的图片或文件夹路径
det_algorithm	使用的检测算法类型	DB
det_model_dir	检测模型所在文件夹。传参方式有两种&＃xff0c;1. None: 自动下载内置模型到 `~/.paddleocr/det`&＃xff1b;2.自己转换好的inference模型路径&＃xff0c;模型路径下必须包含model和params文件	None
det_max_side_len	检测算法前向时图片长边的最大尺寸&＃xff0c;当长边超出这个值时会将长边resize到这个大小&＃xff0c;短边等比例缩放	960
det_db_thresh	DB模型输出预测图的二值化阈值	0.3
det_db_box_thresh	DB模型输出框的阈值&＃xff0c;低于此值的预测框会被丢弃	0.5
det_db_unclip_ratio	DB模型输出框扩大的比例	2
det_east_score_thresh	EAST模型输出预测图的二值化阈值	0.8
det_east_cover_thresh	EAST模型输出框的阈值&＃xff0c;低于此值的预测框会被丢弃	0.1
det_east_nms_thresh	EAST模型输出框NMS的阈值	0.2
rec_algorithm	使用的识别算法类型	CRNN
rec_model_dir	识别模型所在文件夹。传参方式有两种&＃xff0c;1. None: 自动下载内置模型到 `~/.paddleocr/rec`&＃xff1b;2.自己转换好的inference模型路径&＃xff0c;模型路径下必须包含model和params文件	None
rec_image_shape	识别算法的输入图片尺寸	"3,32,320"
rec_char_type	识别算法的字符类型&＃xff0c;中英文(ch)、英文(en)、法语(french)、德语(german)、韩语(korean)、日语(japan)	ch
rec_batch_num	进行识别时&＃xff0c;同时前向的图片数	30
max_text_length	识别算法能识别的最大文字长度	25
rec_char_dict_path	识别模型字典路径&＃xff0c;当rec_model_dir使用方式2传参时需要修改为自己的字典路径	./ppocr/utils/ppocr_keys_v1.txt
use_space_char	是否识别空格	TRUE
drop_score	对输出按照分数(来自于识别模型)进行过滤&＃xff0c;低于此分数的不返回	0.5
use_angle_cls	是否加载分类模型	FALSE
cls_model_dir	分类模型所在文件夹。传参方式有两种&＃xff0c;1. None: 自动下载内置模型到 `~/.paddleocr/cls`&＃xff1b;2.自己转换好的inference模型路径&＃xff0c;模型路径下必须包含model和params文件	None
cls_image_shape	分类算法的输入图片尺寸	"3, 48, 192"
label_list	分类算法的标签列表	[&＃39;0&＃39;, &＃39;180&＃39;]
cls_batch_num	进行分类时&＃xff0c;同时前向的图片数	30
enable_mkldnn	是否启用mkldnn	FALSE
use_zero_copy_run	是否通过zero_copy_run的方式进行前向	FALSE
lang	模型语言类型,目前支持目前支持中英文(ch)、英文(en)、法语(french)、德语(german)、韩语(korean)、日语(japan)	ch
det	前向时使用启动检测	TRUE
rec	前向时是否启动识别	TRUE
cls	前向时是否启动分类 (命令行模式下使用use_angle_cls控制前向是否启动分类)	FALSE
show_log	是否打印det和rec等信息	FALSE
type	执行ocr或者表格结构化, 值可选[&＃39;ocr&＃39;,&＃39;structure&＃39;]	ocr

结论

真香&＃xff0c;后期研究一下如何在自己的数据集上训练模型

参考

PaddleOCR/whl.md at release/2.3 · PaddlePaddle/PaddleOCR · GitHub
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.3/README_ch.md

推荐阅读

go
UE4 中的距离场技术详解

本文将深入探讨 Unreal Engine 4 (UE4) 中的距离场技术，包括其原理、实现细节以及在渲染中的应用。距离场技术在现代游戏引擎中用于提高光照和阴影的效果，尤其是在处理复杂几何形状时。文章将结合具体代码示例，帮助读者更好地理解和应用这一技术。 ... [详细]

蜡笔小新 2024-11-19 18:21:03
python
Java毕业设计：在线办公工作流系统MyBatis+源码+调试部署+数据库+论文

本文介绍了基于Java的在线办公工作流系统的毕业设计方案，涵盖了MyBatis框架的应用、源代码分析、调试与部署流程、数据库设计以及相关论文撰写指导。 ... [详细]

蜡笔小新 2024-11-25 10:21:47
python
进程管理：并发、并行、子进程启动与进程池应用

本文介绍了进程的基本概念及其在操作系统中的重要性，探讨了进程与程序的区别，以及如何通过多进程实现并发和并行。文章还详细讲解了Python中的multiprocessing模块，包括Process类的使用方法、进程间的同步与异步调用、阻塞与非阻塞操作，并通过实例演示了进程池的应用。 ... [详细]

蜡笔小新 2024-11-25 16:40:13
filter
利用 Python 和 Scapy 实施 DNS 欺骗攻击的技术解析

本文详细介绍了如何使用 Python 编程语言中的 Scapy 库执行 DNS 欺骗攻击，包括必要的软件安装、攻击流程及代码示例。 ... [详细]

蜡笔小新 2024-11-25 15:52:30
python
赠送《易懂的Python算法指南》及《Go语言编程从入门到精通》

为帮助编程爱好者更好地掌握Python和Go语言的核心技能，我们特别提供两本精选图书的免费赠阅机会。《易懂的Python算法指南》适合所有希望提高算法理解能力的读者，《Go语言编程从入门到精通》则面向对Go语言感兴趣的初学者及有一定基础的开发者。 ... [详细]

蜡笔小新 2024-11-25 15:14:25
go
深入探讨前端代码优化策略

本文深入讨论了前端开发中代码优化的关键技术，包括JavaScript、HTML和CSS的优化方法，旨在提升网页加载速度和用户体验。 ... [详细]

蜡笔小新 2024-11-21 10:57:01
python
BeautifulSoup4：Python的HTML/XML解析利器

BeautifulSoup4 是一个功能强大的HTML和XML解析库，它能够帮助开发者轻松地从网页中提取信息。本文将介绍BeautifulSoup4的基本功能、安装方法、与其他解析工具的对比以及简单的使用示例。 ... [详细]

蜡笔小新 2024-11-26 14:44:14
go
[编程题] LeetCode上的Dynamic Programming(动态规划)类型的题目

继上次把backTracking的题目做了一下之后：backTracking，我把LeetCode的动态规划的题目又做了一下，还有几道比较难的Medium的题和Hard的题没做出来，后面会继续 ... [详细]

蜡笔小新 2024-11-26 14:31:10
python
利用50行Python代码打造经典游戏，既是休闲娱乐，也是编程学习的利器

Free Python Games 是一个适合学生和初学者的项目，它不仅提供了高度的组织性和灵活性，还极大地激发了用户的探索与理解能力。 ... [详细]

蜡笔小新 2024-11-26 12:28:22
python
利用 Arcade 库在 Python 中绘制太阳

本文介绍如何使用 Arcade 库在 Python 中绘制太阳，包括环境配置、基础图形绘制方法及具体代码示例。 ... [详细]

蜡笔小新 2024-11-25 18:28:20
go
SQL 数据恢复技巧：利用快照实现高效恢复

本文详细介绍了如何在 SQL 中通过数据库快照实现数据恢复，包括快照的创建、使用及恢复过程，旨在帮助读者深入了解这一技术并有效应用于实际场景。 ... [详细]

蜡笔小新 2024-11-25 18:00:40
python
Frida环境搭建与基础使用教程

本文详细介绍了如何在本地环境中安装配置Frida及其服务器组件，以及如何通过Frida进行基本的应用程序动态分析，包括获取应用版本和加载的类信息。 ... [详细]

蜡笔小新 2024-11-25 17:43:00
python
Python 中的生成器表达式与各类推导式详解

本文详细介绍了Python中的生成器表达式、列表推导式、字典推导式及集合推导式等，探讨了它们之间的差异，并提供了丰富的代码示例。 ... [详细]

蜡笔小新 2024-11-25 10:31:32
python
Hadoop集群搭建：实现SSH无密码登录

本文介绍了如何在CentOS 7 64位操作系统环境下配置Hadoop集群中的SSH无密码登录，包括环境准备、用户创建、密钥生成及配置等步骤。 ... [详细]

蜡笔小新 2024-11-24 19:47:28
python
精选10款Python框架助力并行与分布式机器学习

随着神经网络模型的不断深化和复杂化，训练这些模型变得愈发具有挑战性，不仅需要处理大量的权重，还必须克服内存限制等问题。本文将介绍10款优秀的Python框架，帮助开发者高效地实现分布式和并行化的深度学习模型训练。 ... [详细]

蜡笔小新 2024-11-20 19:44:05

Tags | 热门标签

RankList | 热门文章